#mejora de voz

SSNAPS: Separación audiovisual de voz y ruido de fondo con difusión inversa

SSNAPS: método no supervisado basado en difusión inversa que separa voz y ruido de fondo en escenas audiovisuales, superando a modelos supervisados en WER.

2026-06-16 · 2 min

BASENet: Red de mejora de voz adaptada por bandas con atención entre bandas

Descubre BASENet, una red de mejora de voz que alcanza 3.55 PESQ con solo 0.83M parámetros, ideal para streaming en dispositivos limitados.

2026-06-12 · 2 min

Adición de observaciones guiada por inteligibilidad sin entrenamiento para ASR ruidoso

Mejora el reconocimiento de voz en entornos ruidosos con un nuevo método sin entrenamiento que fusiona señales de forma inteligente. Aumenta la precisión y robustez.

2026-06-09 · 2 min

DBHN-Net: Red Híbrida de Doble Rama para Mejora de Voz de Baja Complejidad

¡Descubre DBHN-Net! La red híbrida que reduce 7.5x la complejidad computacional en mejora de voz sin perder rendimiento.

2026-06-05 · 2 min